Рынок заведений общественного питания Москвы

Основные положения

Описание проекта

Инвестор просят подготовить исследование рынка Москвы, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего места для нового заведения питания.
Для выполнения работы доступен датасет с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года.

Цель работы

Цель работы - подготовить презентацию, которая поможет в выборе подходящего места для открытия заведение общественного питания в Москве.

План выполнения работ

План работ:

  1. Загрузить данные и оценить состав исходной информации.
  2. Провести предобработку данных.
  3. Проанализировать весь состав исходных данных.
  4. Детализация анализа в отношении кофеен.
  5. Подготовка презентации.

Выполнение работы

Получение данных

Всего 8406 записи. Типы данных: float64(6), int64(1), object(7).

Предобработка данных

Поиск дубликатов

Приведем значения всех текстовых столбцов к нижнему регистру, чтобы проверить на дубликаты без учета регистра в написании слов.

Проверим, есть ли дубликаты заведений с различающимися харктеристиками.

Проверим визуально, насколько эти записи реально являются дубликатами. Отобразим основные и дублиующиеся значения.

Хотя у некоторых дубликатов категории и координаты не совпадают, одинаковые рейтинги и количество посадочных мест говорят о том, что это все-таки дубликаты.
Название "Кафе", вероятно, записано из-за отсутствия точных сведений о реальном названии. По остальным строкам, очевидно, есть дублирование, но надо понять, какие данные следует оставить, так как они в некоторых колонках заполнены по-разному. Например, во времени работы и признаке принадлежности сети.

Проверим все записи с названиями из списка дублирующихся заведений.

Исключим название "кафе".

По всем дубликатам нашлись еще по одному заведению с другим адресом. Имеет смысл из дубликатов оставить только те, которые имеют признаки сетевых. Альтернативные удаляем.

Поиск пропусков

Проверим, сколько пустых значений NaN в каждой колонке.

Заполним пустые ячейки в колонке hours значением 'нет данных'.

Что делать с попущенными значениями будет понятно из того, для каких выводов потребуются эти данные.

Отдельный столбец с названием улицы

Проверим, где улица не обработалась, по длине строки значения в новом столбце улицы.

Очевидна ошибка в заполнении адреса. Данный адрес можно не учитывать.

Признак круглосуточной работы

Создаем новый столбец is_24_7 с логическим признаком круглосуточной работы.

Всего 730 заведений работают ежедневно и круглосуточно.

Проверяем датасет:

Анализ данных

Категории заведений

Наибольшее количество заведений присутствует в категории "кафе" - 2377, наименьшее - в категории "булочная" - 256.

Количество посадочных мест

Оценим все данные и величины их выбросов.

Ограничим видимую область для лучего масштаба, построим два графика с сортировкой медианных средних числа посадочных мест сначала сетевых заведений, затем - несетевых.

Если учитывать сетевые заведения, то по убыванию медианных значений количества посадочным мест порядок будет такой: 'ресторан', 'кофейня', 'бар,паб', 'столовая', 'быстрое питание', 'кафе', 'пиццерия', 'булочная'. Для несетевых заведений - 'бар,паб', 'ресторан', 'столовая', 'кофейня', 'пиццерия', 'быстрое питание', 'кафе', 'булочная'.

Соотношение сетевых и несетевых заведений

Не сетевых заведений больше - их 62% от общего числа, а сетевых - 38%.

Категории сетевых заведений

По доле сетевых заведений лидирует категория "Булочные", затем идут "Пиццерия" и "Кофейня".

Популярные сети

Выберем 15 сетей с наибольшим количеством точек.

Проверим, к каким категориям относятся ТОП15 сетей.

Объединим название сети с ее категорией для удобства визуализации.

Заведения по районам Москвы

Больше всего заведений в ЦАО, особенное отличие от других округов по категориям рестоанов, кофеен, кафе и баров.
Меньше всего заведений в СЗАО.

Средние рейтинги

Ввиду того, что все оценки ограничены значениями от 1 до 5, для оценки можно использовать среднее арифметическое.

Отсортируем по седнему рейтингу несетевых заведений.

Наиболее высокие рейтинги у баров. Затем у несетевых кофеен, ресторанов и пиццерий. У быстрого питания самые низкие средние рейтинги, которые меньше, чем у баров на 0.7.

Хороплет с рейтингом

Рассчитаем средний рейтинг заведений каждого района.

Заведения на карте

Топ-15 улиц по количеству заведений

Немного неожиданно рассматривать МКАД, как улицу. Но формально, МКАД - главная магистральная улица 1-го класса.

Больше всего заведений на проспекте Мира. Особенно много на ней ресторанов, кофеен и кафе.

Улицы с одним объектом

Не смотря на то, что в ЦАО больше всего заведений, в этом округе самое большое количество улиц всего с одним заведением. Несетевых заведений, присутствующих в одиночку на какой-то улице, в три раза больше, чем сетевых. Подавляющее большинство таких заведений не работают ежедневно и круглосуточно. У большинства из них рейтинг от 4.3 до 4.5. Цены - средние. Количество посадочных мест - до 100.

Скорей всего, на этих улицах низкая проходимость, или они довольно короткие и рядом уже есть заведения питания.

Средние чеки по округам Москвы

Рассчитаем медианные значения средних чеков для каждого округа.

Самые высокие средние чеки в Центральном и Западном административных округах. В остальных округах цены ниже.

Посчитаем условное угловое расстояние заведений от центра Москвы.

Разделим все расстояние от центра на условные 5 зон удаления.

Видно, что в самом центре и ближайшей к нему зоне цены выше. Далее цены приблизительно одинаковые и начинают снижаться только ближе к МКАД.

Общий вывод по анализу данных

В данных присутствуют следующие типы заведений: 'кафе' 'ресторан' 'кофейня' 'бар,паб' 'пиццерия' 'быстрое питание' 'столовая' 'булочная'.
Наибольшее количество заведений присутствует в категории "кафе" - 2377, наименьшее - в категории "булочная" - 256.

Если учитывать сетевые заведения, то по убыванию медианных значений количества посадочным мест порядок будет такой: 'ресторан', 'кофейня', 'бар,паб', 'столовая', 'быстрое питание', 'кафе', 'пиццерия', 'булочная'. Для несетевых заведений - 'бар,паб', 'ресторан', 'столовая', 'кофейня', 'пиццерия', 'быстрое питание', 'кафе', 'булочная'.

Несетевых заведений больше - их 62% от общего числа, а сетевых - 38%.

Категории по убыванию доли сетевых заведений: 'булочная', 'пиццерия', 'кофейня', 'быстрое питание', 'ресторан', 'кафе', 'столовая', 'бар,паб'. То есть, по доле сетевых заведений лидирует категория "Булочные", затем идут "Пиццерия" и "Кофейня".

Топ-15 сетей: 'Шоколадница', "Домино'с Пицца", 'Додо Пицца', 'One Price Coffee', 'Яндекс Лавка', 'Cofix', 'Prime', 'КОФЕПОРТ', 'Кулинарная лавка братьев Караваевых', 'Теремок', 'CofeFest', 'Чайхана', 'Буханка', 'Drive Café', 'Кофемания'.
Категории этих заведений по убыванию частотности: кофейня, кафе, ресторан, пиццерия, булочная.
Больше всего заведений в ЦАО, особенное отличие от других округов по категориям рестоанов, кофеен, кафе и баров.
Меньше всего заведений в СЗАО.

Наиболее высокие рейтинги у баров. Затем у несетевых кофеен, ресторанов и пиццерий. У быстрого питания самые низкие средние рейтинги, которые меньше, чем у баров на 0.7.

Перечень административных округов по убыванию рейтинга: 'Центральный АО', 'Северный АО', 'Северо-Западный АО', 'Южный АО', 'Западный АО', 'Восточный АО', 'Юго-Западный АО', 'Северо-Восточный АО', 'Юго-Восточный АО'.

Список улиц по убыванию количества заведений: 'проспект Мира', 'Профсоюзная улица', 'проспект Вернадского', 'Ленинский проспект', 'Ленинградский проспект', 'Дмитровское шоссе', 'Каширское шоссе', 'Варшавское шоссе', 'Ленинградское шоссе', 'МКАД', 'Люблинская улица', 'улица Вавилова', 'Кутузовский проспект', 'улица Миклухо-Маклая', 'Пятницкая улица'. Больше всего заведений на проспекте Мира. Особенно много на ней ресторанов, кофеен и кафе.

Не смотря на то, что в ЦАО больше всего заведений, в этом округе самое большое количество улиц всего с одним заведением. Несетевых заведений, присутствующих в одиночку на какой-то улице, в три раза больше, чем сетевых. Подавляющее большинство таких заведений не работают ежедневно и круглосуточно. У большинства из них рейтинг от 4.3 до 4.5. Цены - средние. Количество посадочных мест - до 100. Количество улиц с одним заведением - 453. Скорей всего, на этих улицах низкая проходимость, или они довольно короткие и рядом уже есть заведения питания.

Самые высокие средние чеки в Центральном и Западном административных округах. В остальных округах цены ниже.

В самом центре и ближайшей к нему зоне цены выше. Далее цены приблизительно одинаковые и начинают снижаться только ближе к МКАД.

Детализация исследования

Сколько всего кофеен

В каких районах больше кофеен, каковы особенности расположения

Больше всего кофеен в Центральном АО. Значительные количества также в САО, СВАО, ЗАО и ЮАО.

Расположение кофеен показано ниже на карте.

Круглосуточные кофейни

Распределение рейтингов кофеен по районам

Максимальный средний рейтинг - 4.34 в ЦАО, минимальный - 4,2 в ЗАО. Отличия небольшие.

Стоимость чашки капучино

Максимальная медианная стоимость чашки кофе - 189 р. в ЗАО, минимальная медианная - 147.5 в ЮВАО. Разница около 25%.

На какую стоимость чашки капучино стоит ориентироваться

При определении стоимости чашки капучино стоит ориентироваться на среднюю стоимость в конкретном административном округе. По мере повышения рейтинга имеет смысл и повышать стоимость чека.
Цена является одним из факторов конкурентоспособности, но сравнивать потребитель будет только в условиях ближайшей доступности.

Открытие нового заведения

Определенить точку открытия можно по следующим критериям:

На графике выше можно визуально оценить концентрацию точек с невысоким рейтингом. Концентрация косвенно свидетельствует о хорошей проходимости, а невысокий рейтинг говорит о возможности конкурировать.

Если исходить из имеющимися данными, можно определить улицы с количеством точек выше определенного минимума (например, выше 5, хотя это число должно быть пропорционально длине улицы) и со средним по улице рейтингом ниже определенного уровня (например, 4.5).
Составим список таких улиц и обозначим на карте эти заведения. Потенциально, размещать новые точки можно недалеко от обозначенных на карте.

Вывод детализации по кофейням

  1. Всего в датасете 1413 кофеен
  2. Больше всего кофеен в Центральном АО. Значительные количества также в САО, СВАО, ЗАО и ЮАО.
  3. Всего куглосуточных кофеен: 59.
  4. Округи по убыванию рейтинга кофеен: 'Центральный АО'(4.34), 'Северо-Западный АО', 'Северный АО', 'Юго-Западный АО', 'Восточный АО', 'Южный АО', 'Юго-Восточный АО', 'Северо-Восточный АО', 'Западный АО'(4.2).
    Максимальная медианная стоимость чашки кофе - 189 р. в ЗАО, минимальная медианная - 147.5 в ЮВАО. Разница около 25%.
  5. При определении стоимости чашки капучино стоит ориентироваться на среднюю стоимость в конкретном административном округе. По мере повышения рейтинга имеет смысл и повышать стоимость чека.
    Цена является одним из факторов конкурентоспособности, но сравнивать потребитель будет только в условиях ближайшей доступности.
  6. Для открытия новой точки наиболее перспективные округи: Западный и Северо-Восточный.
    В них невысокий средний рейтинг заведений и не самое малое количество точек.
    В Западном еще и высокий средний чек, а в Северо-Восточном одно из высоких количество улиц всего с одним заведением питания.

Выводы

  1. В результате проведенной работы выполнена предварительная обработка данных.
  2. Проведен анализ данных. Выводы по анализу представлены в п. 2.3.13 Общий вывод по анализу данных
  3. Проведен более детальный анализ данным по кофейням. Выводы по анализу представлены в п. 2.4.8 Вывод детализации по кофейням
  4. Подготовлена презентация.